CIとモデリングによるシステム構成(Collaborative Intensive and Focused Session)
発表者 礒川悌次郎(兵庫県立大学),発表日 2021年3月26日
発表概要
浄水場における河川水量や取水濁度の予測を行うシステム
予測を行うために,浄水場周辺の地域を数理モデル化
タンクモデル菅原,1974によって,山への降雨→地層内外の水の流れ→河川,という地域をモデル化した 直列3段のタンクモデル: 各タンクの排水率,排水の閾値などがパラメータになる
CI手法として,粒子群最適化法(PSO)による数理モデルのパラメータ設定
実数値集合を探索するためにPSOを選択した
実際の水位や濁度を用いてパラメータ設定を行ったところ,現実の河川水量変化や濁度変化を再現するモデルを作成することができた
ニューラルネットワーク(RNN,LSTM)などでモデル化するよりも,モデル内部の挙動を把握しやすい
説明可能なシステムを構成できる可能性がある
対象となるシステムを扱っている方々(=浄水に関わっている方々)には取っつきやすいと思われる
議論内容
現在のモデルでは,降水から取水するところまでを一つのタンクモデルとして表しているが,これをさらに細分化する必要はないか? どこに雨が降るかによって河川の濁り度合いに影響を与えるのであれば,複数のタンクモデルを構成することも可能ではないか?
濁度だけでなく色度などのほかの要素がある場合には並列にタンクモデルを用意することが有効ではないかと考えられる.パラメータ探索の困難さ,濁度以外のデータを用意できるのかどうかによってモデルを複雑にすることも可能であると考えられる.
タンクモデルのタンクは単なる積分器なので,複雑な形状の波形を出すことは難しい.濁度が低いところの細かい振動は予測できないのではないか?
濁度のピークとなるところが予測できれば良いので,濁度の低いところはそれほど重要ではないと考えている.
予測精度を絶対誤差で評価しているので最小二乗法に基づく方法は使えないからPSOを使う,というのは良い説明のような気がする
確率に頼らない方法で最適化ができると良いのですが..
河川の空間的な広がり・影響がどの程度モデルに影響が与えているのかが良く分からない
かなり広い空間を3つのタンクだけでモデル化している
パラメータの数(あるいはモデル構造)をどのようにして決めるのかについては何かノウハウがあるのか? どの程度試行錯誤したのか?
2~3段くらいのモデルは試した
仕事をしていないタンクなどもあった
山の中腹あたりをモデル化しているので表面流出と表面浸透くらいでモデル化できるのではないか?
大規模な浄水場は人間が監視できるので,人間が監視できないくらいに小規模な浄水場のモデルを作るのに適しているのではないか?
モデルの複雑さと得られたデータの関係を見ながらモデル化することは難しいのではないか?
入力として気象庁の降雨データを用いているのため入力データとしてはかなりノイズが含まれていて,かつモデルが非常に広範囲のものを単純にモデル化しているような状況でうまく動くシステムになっているのはどのように考えれば良いか?
単純化しているため,様々なノイズに強いのではないか?
勾配法を用いた最適化法などが適用できるシステムであるのか?
システム全体は非線形微分方程式にて記述している
90年代に遺伝的アルゴリズムや共益勾配法を用いた仕事はある
データの数が少ない場合,汎化性能が獲得できない場合があるのではないか?
学習用データ(パラメータを決めるためのデータ)と評価用のデータは分けて使っている
得られたパラメータ群は対象流域でしか使用できない
様々な降雨状況を学習に用いているので,入力依存性はないのではないか?
これまでにない降雨状況については,作成したモデルが現実の山岳・河川を反映していればある程度は再現できるかも.
分布系のシステムを集中系にモデル化しているように見える.本来は水系は分布形なので,並列にモデルを作っておいて最後に分布系を考慮して結合させることができるのではないか?
PSOを使う方法は良いが計算時間が非常にかかるのが問題である.最適制御の計算と同じようにハミルトニアンを使ってパラメータ微分を行うと勾配が算出できるので,最急降下法や勾配降下法などを使うのが良いのではないか?
LSTMとの比較をやってみるのが良いのではないか?
LSTMの構造やハイパーパラメータを決めるため物理構造を考慮することができれば良いのではないか?
システムをモデル化する際に分かっているところは物理的なモデリングを行い,分からないところはNNなどの力を借りるというハイブリッド的なものがCIではないか?
降雨がどのくらいの長さになるのかにもよるが,短期間に激しい雨が降るとインパルス応答のようなものが現れるため,タンクの特性として3次系や2次系が良いのかということや,推定できるパラメータがただ一つに決まるのか,それを満たすような入力になっているのかというようなことが満たされていれば,季節を問わず使える可能性はあるのではないか?
データには季節性がある(どの程度の濁度が出やすいか)
どのような経緯でこのモデルを採用したのか? 大規模なシステムを十分な精度でモデル化するための標準的なアプローチとしてはどのようなものがあるのか? このようなものがあると他のシステムの構築に役に立つのではないか.
単純にモデル化するところから始めている
今回はドメイン知識を持っている人とシステム系の研究者の知見とのマッチングをとるという形になった
入力と出力の間のゲインはいくつか?
タンク同士をつないでいる係数を水位に依存した形で書くと,ダイナミクスはかなり変わるが計算はかなり楽になるので勾配法で解くことができてフィッティングも良くなるのではないか?
(古典)制御工学の例として,教科書の最初のほうでタンクモデルが出てくる
CIとモデリングのありかた
深層学習に代表される数多くのパラメータを持つシステムを作ることは,対象となるシステムの挙動を真似ることは容易となるが,どのような原理によりシステムを表現しているのかが不明である.
物理的なモデルを想定することは,このようなパラメータの一部を固定することに対応しており,パラメータ集合を小さくなることやモデルの挙動が理解しやすくなる,ということが期待できる.